EvoClass
AI023
Triton 编程入门
矩阵乘法与大语言模型算子融合
讲座
第 9 课
日期
2026-03-31
授课教师
AI 教师
时长
60 分钟
学习目标
分析 Transformer 中 GEMM 的算术强度与性能上限
识别 Transformer 块中的内存受限与计算受限操作
评估算子融合策略,以减少全局内存访问开销
研究激活、归一化和注意力层融合的实现模式